
一张卡片,不仅 AI 了我的工作,还摸清了我的八字和 MBTI?|AI 上新
一张卡片,不仅 AI 了我的工作,还摸清了我的八字和 MBTI?|AI 上新AI 硬件,已经成为大模型之后,又一个令人兴奋的领域。 正如 AI Agent 从通用开始走向垂直,AI 硬件,也已经逐渐分化到「陪伴」、「工作」等各个垂直领域。
AI 硬件,已经成为大模型之后,又一个令人兴奋的领域。 正如 AI Agent 从通用开始走向垂直,AI 硬件,也已经逐渐分化到「陪伴」、「工作」等各个垂直领域。
这段时间 AI 编程的热度完全没退,一个原因是国内接连推出开源了不少针对编程优化的大模型,主打长上下文、Agent 智能体、工具调用,几乎成了标配,成了 Claude Code 的国产替代,比如 GLM-4.5、DeepSeek V3.1、Kimi K2。
随着垂直领域 agent 的兴起,市面上的应用越来越多,用户不可避免地需要一个编排工具(orchestration tool)来将这些分散的应用串联起来,或者需要某种横向工具(horizontal tool)来统一构建 agent。而 n8n 正是这一生态位中的佼佼者,它正从一个工作流自动化工具,升级为 AI 应用的编排层。
Intent近日宣布获得数千万美元战略投资, a16z 与 GV 联合领投,跟投方还包括几位前微信产品负责人创立的基金。在 2025 年 AI Agent 市场规模已经冲到 73.8 亿美元的节点上,这笔钱显然押注的是“聊天即执行”这个赛道的爆发潜力。
我们也看过各种 AI Coding 领域的评测,发现大多停留在了 「代码生成」与「封闭题目」的考核,却忽视了环境配置、依赖处理、跨仓库资源利用等开发者必经的真实需求 —— 当下众多 Benchmark 仅通过题目,已难以衡量 Code Agent 的实际效果。
大厂在 AI Agent 上的每一步动作,都值得紧盯。因为没人能预测,一个看似小小的产品,最终会被扩展到多大规模,串联出怎样的「新业务体系」。
近日,上海交大和上海人工智能实验室的研究发现,AI 的风险正从个体失控转向群体性的恶意共谋(Collusion)——即多个智能体秘密协同以达成有害目标。Agent 不仅可以像人类团队一样协作,甚至在某些情况下,还会展现出比人类更高效、更隐蔽的「团伙作案」能力。
杜克大学与 Zoom 的研究者们推出了 LiveMCP-101,这是首个专门针对真实动态环境设计的 MCP-enabled Agent 评测基准。该基准包含 101 个精心设计的任务,涵盖旅行规划,体育娱乐,软件工程等多种不同场景,要求 Agent 在多步骤、多工具协同的场景下完成任务。
做销售的朋友大概都有过这样的经历:跟进客户时要在邮箱、微信、Excel 间反复切换,好不容易把信息汇总到 CRM 系统,却发现格式不对要重新调整。这种 "人围着系统转" 的困境,正在被一家叫 Attio 的初创公司改写。
人工智能的浪潮正将我们推向一个由 RAG 和 AI Agent 定义的新时代。然而,要让这些智能体真正「智能」,而非仅仅是信息的搬运工,就必须攻克一个横亘在所有顶尖团队面前的核心难题。这个难题,就是推理密集型信息检索(Reasoning-Intensive IR)。